Telegram Group & Telegram Channel
От провала к половине успеха за пять лет: удивительный прогресс языковых моделей

Исследователи из организации METR в Беркли обнаружили тревожную тенденцию: скорость развития искусственного интеллекта в решении сложных задач растет экспоненциально. С 2019 года так называемый «временной горизонт» — показатель, отражающий продолжительность задач, которые ИИ может выполнить с 50% вероятностью успеха — удваивался каждые семь месяцев, а в 2024 году темп ускорился до удвоения каждые три месяца.

В ходе исследования были проанализированы 13 передовых моделей ИИ на почти 170 реальных задачах в области программирования, кибербезопасности и логического мышления. Результаты поразительны: если в 2019 году GPT-2 не мог решить задачи длительностью более минуты, то выпущенный в феврале 2024 года Claude 3.7 Sonnet уже справляется с половиной задач, требующих от человека 59 минут работы. При сохранении текущих темпов к 2029 году ИИ сможет решать задачи, занимающие у человека целый месяц — время, достаточное для запуска стартапа или научного открытия.

Прогресс моделей ИИ объясняется не только увеличением объемов обучающих данных и количества параметров, но и качественными улучшениями в логическом мышлении, умении использовать инструменты и исправлять ошибки. Однако экономический эффект от этого развития пока ограничен, поскольку текущий «временной горизонт» около 40 минут недостаточен для выполнения по-настоящему ценных задач. Эксперты разделились во мнениях: одни считают прогнозы слишком оптимистичными, другие уверены, что потенциал ИИ используется недостаточно активно из-за отсутствия инвестиций в его интеграцию.

@SciTechQuantumAI



tg-me.com/SciTechQuantumAI/1214
Create:
Last Update:

От провала к половине успеха за пять лет: удивительный прогресс языковых моделей

Исследователи из организации METR в Беркли обнаружили тревожную тенденцию: скорость развития искусственного интеллекта в решении сложных задач растет экспоненциально. С 2019 года так называемый «временной горизонт» — показатель, отражающий продолжительность задач, которые ИИ может выполнить с 50% вероятностью успеха — удваивался каждые семь месяцев, а в 2024 году темп ускорился до удвоения каждые три месяца.

В ходе исследования были проанализированы 13 передовых моделей ИИ на почти 170 реальных задачах в области программирования, кибербезопасности и логического мышления. Результаты поразительны: если в 2019 году GPT-2 не мог решить задачи длительностью более минуты, то выпущенный в феврале 2024 года Claude 3.7 Sonnet уже справляется с половиной задач, требующих от человека 59 минут работы. При сохранении текущих темпов к 2029 году ИИ сможет решать задачи, занимающие у человека целый месяц — время, достаточное для запуска стартапа или научного открытия.

Прогресс моделей ИИ объясняется не только увеличением объемов обучающих данных и количества параметров, но и качественными улучшениями в логическом мышлении, умении использовать инструменты и исправлять ошибки. Однако экономический эффект от этого развития пока ограничен, поскольку текущий «временной горизонт» около 40 минут недостаточен для выполнения по-настоящему ценных задач. Эксперты разделились во мнениях: одни считают прогнозы слишком оптимистичными, другие уверены, что потенциал ИИ используется недостаточно активно из-за отсутствия инвестиций в его интеграцию.

@SciTechQuantumAI

BY Изобретая будущее




Share with your friend now:
tg-me.com/SciTechQuantumAI/1214

View MORE
Open in Telegram


Изобретая будущее Telegram | DID YOU KNOW?

Date: |

Telegram Gives Up On Crypto Blockchain Project

Durov said on his Telegram channel today that the two and a half year blockchain and crypto project has been put to sleep. Ironically, after leaving Russia because the government wanted his encryption keys to his social media firm, Durov’s cryptocurrency idea lost steam because of a U.S. court. “The technology we created allowed for an open, free, decentralized exchange of value and ideas. TON had the potential to revolutionize how people store and transfer funds and information,” he wrote on his channel. “Unfortunately, a U.S. court stopped TON from happening.”

Изобретая будущее from us


Telegram Изобретая будущее
FROM USA